Novo dicionário de formas flexionadas do Unitex-PB: avaliação da flexão verbal (New Dictionary of Inflected forms of UNITEX-PB: Evaluation of Verbal Inflection)
نویسندگان
چکیده
This paper describes the new version of the dictionary of inflected forms of Unitex-PB, adapted to the Acordo Ortográfico de 1990. Its also presents the evaluation of the verbal forms, which was based in the guidelines established in the first joint evaluation on morphologic analysis of Portuguese (Primeiras Morfolimpı́adas do Português), held in 2003. Resumo. Neste trabalho descreve-se a nova versão do dicionário de formas flexionadas do Unitex-PB, adaptado ao Acordo Ortográfico de 1990. Apresenta ainda a avaliação das formas verbais, que foi realizada a partir dos parâmetros utilizados nas Primeiras Morfolimpı́adas para o Português (2003). 1. Introdução A criação e manutenção de recursos lexicais continua a ser um tema maior no Processamento de Linguagem Natural (PLN). No que diz respeito ao português do Brasil, dentre os diversos recursos criados, o dicionário de formas flexionadas estabelecido por [Muniz et al. 2005] com o sistema UNITEX continua a ser a maior referência de base livremente disponı́vel. Esse recurso foi criado a partir do léxico do REGRA [Nunes et al. 1996, Martins et al. 1998], para os substantivos, adjetivos e advérbios, e a partir da listagem de verbos e de paradigmas de conjugação verbal de [Vale 1990]. Uma revisão recente daquele léxico [Calcia et al. 2014] efetuou sua adaptação ao Acordo Ortográfico1 de 1990, acrescentando também as formas verbais acompanhadas de pronomes pessoais clı́ticos (em ênclise e mesóclise), que não constavam da versão anterior. No presente trabalho, procura-se fazer uma avaliação da flexão verbal dessa nova versão do léxico do Unitex. Para tanto, buscou-se um standard utilizado pelas Primeiras Morfolimpı́adas para o português, organizadas pela Linguateca, de março a junho de 2003 [Santos and Costa 2003]. Na seção seguinte, faz-se uma breve apresentação do Unitex 1http://www.portaldalinguaportuguesa.org/acordo.php [2015-08-10]; todos os URL foram validados nesta data. Proceedings of Symposium in Information and Human Language Technology. Natal, RN, Brazil, November 4–7, 2015. c ©2015 Sociedade Brasileira de Computação.
منابع مشابه
UNITEX-PB, a set of flexible language resources for Brazilian Portuguese∗
This work documents the project and development of various computational linguistic resources that support the Brazilian Portuguese language according to the formal methodology used by the corpus processing system called UNITEX. The delivered resources include computational lexicons, libraries to access compressed lexicons, and additional tools to validate those resources.
متن کاملExtracção de relações semânticas entre palavras a partir de um dicionário: o PAPEL e a sua avaliação
Neste artigo apresentamos o PAPEL, um recurso lexical para o português, constitúıdo por relações entre palavras, extráıdas de forma automática de um dicionário da ĺıngua geral através da escrita manual de gramáticas para esse efeito. Depois de contextualizarmos o tipo de recurso e as opções tomadas, fornecemos uma visão do processo da sua construção, apresentando as relações inclúıdas e a sua q...
متن کاملAutomatic Detection of Spelling Variation in Historical Corpus: An Application to Build a Brazilian Portuguese Spelling Variants Dictionary
The Historical Dictionary of Brazilian Portuguese (HDBP), the first of its kind, is based on a corpus of Brazilian Portuguese (BP) texts from the sixteenth through the eighteenth centuries (and some texts from the beginning of the nineteenth century), being developed under the sponsorship of the Brazilian funding agency CNPq (Conselho Nacional de Desenvolvimento Científico e Tecnológico). It is...
متن کاملSynthesis and Pharmacological Evaluation of a New 2-Azabicyclo[3.3.0]octane Derivative
No âmbito de uma linha de pesquisas que trata do planejamento, síntese e avaliação farmacológica de novos candidatos a protótipos de agentes neuroativos, descrevemos neste trabalho a síntese e avaliação farmacológica de novo análogo do nebracetam contendo a unidade 2-azabiciclo[3.3.0]octano, planejado como candidato a agente nootrópico útil para o tratamento da doença de Alzheimer. A avaliação ...
متن کاملAutomatic Recognition of Composite Verb Forms in Serbian
In this paper, we will present the work on building a shallow parser for recognizing composite verb forms in Serbian – the forms that consist of an auxiliary verb and a main verb. The parser is made in Unitex, a corpus processing software, in the form of local grammars that rely on using morphological dictionaries of Serbian. The model was tested on a small corpus of texts, both written in Serb...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2015